LEVENSHTEIN UZAKLIK ÖLÇEĞİNE GÖRE ÇAĞDAŞ TÜRK YAZI DİLLERİNİN FONETİK UZAKLIĞI
نویسندگان
چکیده
Bu çalışmanın temel amacı Oğuz grubu yazı dillerinin birbirlerine karşı fonetik uzaklıklarını tespit etmektir. Çalışmada uzaklıkların tespiti için bilgisayarlı dil bilim alanında sıkça kullanılan niceliksel ölçüm tekniklerinden Levenshtein uzaklık algoritması kullanılmıştır. bağlamda, Türkiye’deki lehçe araştırmalarında kullanılabilecek bir yöntemi tanıtarak ilgili alanda yeni değerlendirmelerin yapılması adına katkı sunması hedeflenmektedir. 
 Vladimir tarafından geliştirilen ve birçok algoritması, sözcük dizisini diğerine dönüştürürken ekleme, çıkarma yer değiştirme işlemlerinden matematiksel olarak en az işlem gerektiren sayısal değeri etmede algoritmadır. çalışmalarında ilk Brett Kessler çalışmadaki denemenin başarılı olmasının ardından bilimcinin algoritmaya ilgisi artmış, aynı yöntemle değişkesinin uzaklığını ele alan çalışmalar yapılmıştır.
 çalışmada Türkiye Türkçesi, Azerbaycan Türkmen Türkçesinin uzaklığı ile ölçülecektir. Çalışmanın genellenebilir sonuçlar vermesi Türkçe Sıklık Sözlüğü’ne göre sık 40 fiil 13 tematik başlıktan (hayvan, beden, yiyecek, giyim, ulaşım, aile, madde, zaman, spor, tabiat, hava, meslek renk) 216 adet isim olmak üzere toplam 256 madde başı belirlenmiştir. Sözcükler hedef dillere ana dili konuşurları tercüme edilmiştir. Sözcükler, konuşurlarına seslettirilmiş telaffuzları uluslararası alfabeye aktarılmıştır. Kaynak dilden her dildeki karşılığı LUA hesaplanarak sözcüklerin uzaklıkları edilmişir. Örnek setindeki tüm çiftlerine bu uygulandıktan sonra hesaplanan ortalama değer alınarak Türk olan hesaplanmıştır.
منابع مشابه
Approximate Periods with Levenshtein Distance
We present a new algorithm deciding for strings t and w whether w is an approximate generator of t with Levenshtein distance at most k. The algorithm is based on finite state transducers.
متن کاملYazılım Efor Tahmininde Farklı Bir Yaklaşım: Sınır Değerlerine Göre Tahmin
Özet. Yazılım efor tahmini, yazılım proje yönetiminde çok önemli bir aşamadır. Tahmin değerinin doğruluğu proje başarı ya da başarısızlığına doğrudan etki eder. Yöneticiler uygun kaynakları tahmin etmeye çalışırlar ve bu yönetim için zorlayıcı bir durumdur. Araç ve tekniklerin yardımıyla tahmin süreci daha iyi gerçekleştirilebilir. COCOMO en çok kullanılan, parametrik modellerden biri olarak if...
متن کاملOne-Gapped q-Gram Filtersfor Levenshtein Distance
We have recently shown that q-gram filters based on gapped q-grams instead of the usual contiguous q-grams can provide orders of magnitude faster and/or more efficient filtering for the Hamming distance. In this paper, we extend the results for the Levenshtein distance, which is more problematic for gapped q-grams because an insertion or deletion in a gap affects a q-gram while a replacement do...
متن کاملMeasuring Dialect Pronunciation Differences using Levenshtein Distance
The work in this thesis has been carried out under the auspices of the Behavioral and Cognitive Neurosciences (BCN) research school, Groningen. Acknowledgements This thesis is attributed to exactly one author as can be seen on both the cover and the title pages. The author is the one who is responsible for the content. But it should be emphasized that many people contributed to the coming about...
متن کاملIndo-European languages tree by Levenshtein distance
The evolution of languages closely resembles the evolution of haploid organisms. This similarity has been recently exploited [1, 2] to construct language trees. The key point is the definition of a distance among all pairs of languages which is the analogous of a genetic distance. Many methods have been proposed to define these distances, one of this, used by glottochronology, compute distance ...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ژورنال
عنوان ژورنال: Akademik sosyal ara?t?rmalar dergisi
سال: 2023
ISSN: ['2602-2877', '2602-263X']
DOI: https://doi.org/10.31455/asya.1204136